混合数据相关论文
智能问答系统(Question Answering System,QAS)是一种让人类通过自然语言与机器进行问答来获取信息的人机交互系统,是自然语言处理的......
由于大数据的数据量大和数据价值密度低的特性,用于解决信息过载的协同过滤推荐算法存在数据稀疏性问题,进而引发推荐效果不佳的结果......
随着时代的发展,综合评价问题也有了更加复杂的应用背景,具体表现在数据形式复杂和评价主体风险偏好复杂等方面。本文在分析当今综......
簇中心表示、属性权重量化、簇数确定和分析工具缺少是当前混合数据聚类研究中的主要研究热点问题。本文综合应用了簇内标称属性滤......
聚类技术普遍应用于各领域中用来探索数据的有用模式。现有的聚类算法主要是针对相同属性类型的数据,然而实际中产生的大多是由数......
特征选择目前已成为机器学习研究领域的热点之一,其核心是根据某一评估准则从原始特征中获取能够保留初始物理特征的特征子集。粗......
科学技术的迅猛发展,不仅使得人们对生活的环境有了更深层次的认识,更使得人们对生活的品质要求的越来越高。这也使得从现实生活中......
作为一种无监督的学习方式,聚类分析在无标记样本的条件下将数据对象进行分组,挖掘数据的潜在结构,是数据分析的有效工具。在现实......
近年来,随着互联网技术和全球定位技术的发展,最近邻查询广泛应用于位置信息检索,在图像检索、数据处理、模式识别以及机器学习等......
近年来,人工智能和知识发现的发展迅速,计算机技术在各领域的应用日益增多。数据量剧增,并呈现高维度、多类别、结构复杂等特点,对......
聚类分析可以在缺乏先验知识的情况下,根据数据对象的特征及内部结构,使用某种相似性度量对数据集进行分类来挖掘其中有价值的知识......
近年来,探索和发现观测变量间的因果关系在数据科学界受到了广泛的关注,了解事物间的因果关系相对于相关关系或其他统计关系在医学......
在计算智能技术所面临的挑战中,高维的数据集通常具有成千上万的特征,而在这些特征中的信息大部分是冗余和不相关的。为了解决特征......
费率厘定是农业保险的核心问题之一,然而样本数据不足造成厘定费率的信度水平较低,影响农业保险的精细化发展和风险保障作用的发挥......
云计算、物联网、大数据、移动互联网等新一代信息技术的交融渗透,加速了金融、制造、服务等传统产业的跨界融合,吸引了众多互联网......
针对复杂综合评价问题中的混合数据,在描述混合数据处理过程的基础上,讨论了混合数据的转换方法、数据意义的统一,并结合群组评价......
由Pawlak提出的粗糙集理论是处理不精确、不完备、不确定数据的一种有效的数学工具。近年来对粗糙集的研究已经扩展到多个领域,并建......
公共部门的低效率是一个普遍存在的问题。我国的财政税收收入逐年增加,且每年都保持较高的增长率,但这是否是税务部门高效工作的表......
随着科技的发展,人们在生活中产生了大量的数据,其中部分数据具有数值型和分类型两种属性类型.现有的大多数聚类算法只能处理单一......
在系统测试过程中,由于各种干扰的存在,使得测试系统采集到的数据偏离其真实值。而干扰因素不仅包括一般意义下的测量误差,还包括......
设备维修策略决策问题的研究,不但可以降低维修成本,还可以提高设备的可用性、可靠性、安全性及产品质量。目前虽取得了一定的进展......
针对K-prototypes算法处理混合数据时精度不高等问题,提出了一种增强的K-prototypes混合数据聚类算法(An Enhanced K-prototypes M......
增量式属性约简是一种针对动态环境下的数据挖掘方法.目前已经提出的增量式属性约简算法仅适用于符号型的信息系统,而很少有对混合......
基于“蒙特卡罗仿真”的思想,采用随机模拟的方法从混合数据形式的角度对密度算子进行拓展研究。首先,给出了一种将混合数据转化为区......
提出了一个基于邻域密度的异常检测方法,它能处理混合数据的异常值。在该方法中,样本的异常指标被定义为该样本的邻域大小和该样本的......
采用模糊偏好规划法从模糊成对比较集中求取各属性的权值,然后应用基于随机优势和模糊数质心距的ELECTREⅢ方法来对备选维修策略进......
纽约——混合数据表明,重组VIIa因子(rFVIIa)可以改善一些晚期肝硬化患者急性静脉曲张性出血的结局,根据欧洲研究者观点,它可以被用......
大型开放式网络课程MOOC(Massive open online courses)中预测学习者的学习结果会遇到数据分布不平衡问题,为了克服这个问题提出一......
作为一种新的智能计算方法,人工免疫网络已被广泛的应用到模式识别以及数据分类中。现有的人工免疫网络分类算法大都存在两个缺陷:......
混合型数据是数值型数据和分类型数据的结合,而真实数据集大部分是混合数据,因此混合型数据聚类问题得到越来越广泛地关注.主要工......
在实际应用领域,常常存在同时包含数值型和分类型特征的混合数据。然而,已有的大多数聚类算法只能处理数值型或分类型单一类型数据......
矩阵逆特征值问题是计算数学的热门研究方向之一.它在振动结构设计、物性探测、逆时反演、信号重构等许多领域扮演着重要的角色.这......
Excel 在处理数据方面能力很强大,但它也有一套规则和标准规范,即一个单元格只有一个属性.学生在学习excel 时,只是掌握了利用函数......
灾害应急响应业务常面临数据不完备、应急措施适时性强等问题,要求所实现的应急响应方法灵活程度高,易于操作。以灾害救助撤离路线......
特征选择是高维数据处理的一个重要部分,在现实世界中高维的混合数据经常存在。针对高维混合数据,基于模糊粗糙集,在CEBARKNC算法的基......
聚类分析是一种根据数据隐含类别信息对数据进行无监督的聚类算法。文章在聚类算法基础上关于定量属性变量聚类中心采用均值,关于......
基于模糊粗糙集模型构建模糊等价关系是混合数据分析的有效方法之一。针对属性类别多样性的混合型信息系统,提出一种带权的对象间相......
近十多年来,我国乳制品质量安全事件频发,尤其是2008年爆发的“三聚氰胺”事件,严重影响了消费者对国产乳制品质量安全的信心,即使......
多震源同时采集技术能够有效提高采集效率,得到来自多个震源的混合地震数据,该技术能缩短采集周期,降低采集成本,但对混合地震数据......
领域文本具有结构复杂、相似性高以及动态变化等特点,且存在着连续型与离散型并存的混合数据,这在一定程度上限制了知识发现方法对......
聚类分析是客户关系管理(CRM)中非常重要的工具之一.提出一种新的算法,k-centers,通过重新定义相似度衡量和聚类中心更新方法,能够有效处......
费率厘定是农业保险的核心问题之一,然而样本数据不足造成厘定费率的信度水平较低,影响农业保险的精细化发展和风险保障作用的发挥......
在科学研究及工程实践中,输入参数经常同时包含定性因子与定量因子,为实现此类数据的有效建模,提出基于支持向量回归(SVR)的定性-......
同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中......
现有统计调查中存在大量定性和定量的混合数据,为了能用较少指标进行分析,可以采用主成分分析的方法。然而,传统主成分分析要求数......